查看原文
其他

京东技术系统的一些备战日常优化(2)

京东智能供应链 京东技术 2019-05-31

来这里找志同道合的小伙伴!

 导 语 

效率一直是京东智能供应链追求的目标。每次大促备战,最先开始的就是商品备货,智能供应链团队借助机器学习和运筹优化算法,通过销量预测、单量预测、商品布局优化和智能补货,与供应商做好协同工作,将合适数量的货及时布局到离合适的消费者最近的地方,这保障了绝大部分商品能够以合适的时间送到客户手中,然后通过自动调度来满足消费者的实时需求。


今年11·11,智能供应链团队新增了一种“爆品仓”的存货布局模式,大促期间通过设置“爆品仓”来分担库容及生产压力,从而在整体上提升仓库使用率,减低商品的库存综合成本。

供应链系统的改进


供应链协同效率是衡量供应链效率非常重要的指标。


在与供应商协同方面,智能供应链团队开通了专属的400客服电话,与统一反馈服务工单的系统绑定,更便捷地解决问题,进而提升整个京东智能供应链平台内外的跨组织协同效率。


在履约协同方面,智能供应链团队依据客户需求、供应链链条上各节点的产能、负载、时效,进行实时联动调度,保障客户体验的同时,又提升各个仓库生产效率,节省生产成本。


每次大促,平台会出现许多商品断货的情况,消费者买不到心仪的商品,商家也丢失了销售机会。


针对该问题,智能供应链团队在本次11.11前,上线了非现货的履约可视化功能。基于京东智能供应链平台,利用大数据计算模型,将京东与供应商之间的库存供应能力可视化,针对非现货订单,系统会显示详细的调货时间。这样,用户在前、中、后购物环节,均可以明显感知到商品的到货时间,用户时效体验得到极大的优化。非现货可视化同时解决了客户体验问题,也让平台把握了销售机会。


相比于往年,今年的京东智能供应链更增强了消费者的信赖感。为了让消费者能够在前台放心购物,基于区块链技术,智能供应链团队今年实现了大量商品的全流程追溯。


举个例子,消费者在京东买了一袋海参,可以通过京东APP扫码,看到这袋海参来自哪个海域,该海域的产量规模,从放苗到捕捞的过程,包括饲养员、养殖办法、捕捞时间,到粗加工、精加工环节的操作车间、操作员,再到仓库、配送,整个流转环节可视,且这些信息一旦存到了区块链上,就不可篡改。


以上说的是供应链系统在业务上的改进,下面再说一下系统稳定性建设。


系统稳定性的建设


供应链系统一般不直接面对终端客户,不像网站首页、商品列表和详情等系统那样对响应速度有极端要求。对供应链系统来说,更重要的是追求数据一致性,因为生产流程长而复杂,细微的错误可能会在后面的流程中逐步放大,而且可能经过较长时间才可被发现。其次,供应链系统需保持一定的吞吐量,以满足生产需要,不窝工。


在数据一致性方面,设计更多的检查点,在物流、商流、资金流的交叉点做严格有序控制。当然,不排除出现个别极端情况,比如,因为环境问题导致系统稳定性出现问题,影响到生产,可能产生数据不一致的情况。这种情况下,会采取降级措施等预案进行事后补救处理,达成数据最终一致性。针对这种潜在、偶发情况,智能供应链团队在每次大促前都会做演练。


在吞吐量方面,针对长流程,智能供应链团队设计了蓄水和调节装置,只在这个装置的源头承受上游的峰值,将处理对象放到蓄水池中,通过调节装置来动态控制吞吐量,以满足生产需要为最低目标。


这样可以做到以比较低的系统建设成本支持大促的高峰,还可以通过这样的装置帮助流程中的各个环节测试吞吐能力。每次大促,智能供应链团队都利用这个装置来进行演习,直到SLA的达成。


另外,不能只考虑系统的稳定性,还要考虑到业务的稳定性。现实的业务场景是,并不是每个生产单元的需求和产能都一样的,这种差异可能会造成某些生产单元需求少,负载低,造成窝工,这也就允许供应链系统有针对生产单元的调度或者绿色通道。


再有,需要参考历次大促积攒下来的经验,一丝不苟按步骤依据规范执行。通过对系统进行综合评估,积极预防问题,合理利用现有资源,并对可复用资源进行再评估,按需扩缩容;重新梳理上下游应用依赖关系及服务SLA,再次确认依赖系统联系人,制定改造计划,完成系统升级;同时,联合其他业务线条进行近十次的供应链大规模军演和线上故障演练,不断验证,逐步完善,最终达到预期目标。


此外,需要不断锻炼、增强团队对紧急事件的响应能力。通过完善报警/监控机制,保证系统的整体指标、可用性、处理性能、负载、异常数据、业务关键流程不出现盲点。


与此同时,一方面,制定好应用预案,从启动条件、应急场景、启动影响、执行步骤、响应时间等多方面进行复查,保证预案有效可用;另一方面,加强团队的实战演练和组织跨部门的故障处理演练,增强响应能力。


最后,做好值班监控工作,7*24小时值班,以线下远程+现场结合的方式集中值班,与交易、物流等关键上下游团队建立畅快的信息互通机制,加强响应速度。



RECOMMEND

推荐阅读

京东技术系统的一些备战日常优化(1)

Puppet监控速查手册:问题/原因→解决方案

京东自研图计算系统 | JoyGraph

基于Swagger的前后端协同开发解决方案-SMock


京东技术

---关注技术的公众号

长按识别二维码关注

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存